热门标签 | HotTags
当前位置:  开发笔记 > 程序员 > 正文

行业洞察|你的语音小助手的词汇量够吗?

“HiSir,请播放莫扎特的钢琴曲”,“好的,请问您播放哪一首?”如今语音助手已经走入千家万户,无论是手

“Hi Sir,请播放莫扎特的钢琴曲”,“好的,请问您播放哪一首?”... 如今语音助手已经走入千家万户,无论是手机、平板还是智能音箱,几乎都配有随唤随到的语音小助手。

这些对答如流的语音助手,到底有多少词汇量?是否和人类一样需要从ABC开始积累呢?答案是他们并不需要逐步积累,而是通过发音词典库,这个库中涵盖了语音助手能够识别的所有语音。

发音词典 (Lexicon) 包含了从单词 (Words) 到音素 (Phones) 之间的映射,作用是用来连接声学模型和语言模型。发音词典包含系统所能处理的单词的集合,并标明了其发音。其与语音识别其他模块的关系如下:通过发音词典得到声学模型的建模单元和语言模型建模单元之间的映射关系,从而把声学模型和语言模型连接起来,组成一个搜索的状态空间,用于解码器进行解码工作。我们的识别目标是单词序列 (句子的分词结果),每个单词由提前构造好的发音词典 (Lexicon) 转为对应的音素序列 (中文的音素通常指拼音中的声母和韵母),即将单词序列转为音素序列。

在语音识别系统中,发音词典包含的数据量越大,对于提升语音识别的准确率效果越好。发音词典和语种相互对应,每个语种需要准备一个发音词典。当新词汇产生时,可以将这些词汇及对应音标添加进去,不断扩充词典规模。因此,词汇量、音标标注和校对的准确性是衡量该发音词典质量的重要标准。

目前,很多发音词典是自己生成的,准确性相对较低,将影响语音识别系统的性能。如何搜集到准确、大量、覆盖面全的发音词典,成为语音领域的又一难题。同时,由于发音词典的搜集、标注、清洗需要专业的语言学家和声学家把控,因此发音词典语料的开源甚少。

目前,Magic Data已建立了成熟的发音词典构建流程,积累了深厚的语音语言学基础研究成果。拥有包括粤语、闽南语、四川话、天津话、武汉话、长沙话、山西话、南昌话、上海话、客家话等各种方言。同时拥有众多常用的语种,包括英语、日语、法语、西班牙语、意大利语、德语、葡萄牙语、印尼语等语种的发音词典。

发音词典需要经过全面的搜集、精细的标注、其中每个单词都经过人工校对,才可以称为高质量的发音词典。通过发音词典可以用来构建更大、更全面、更准确的发音词典库,从而提升语音识别的准确率。


推荐阅读
  • 本文详细介绍了如何在 Windows 10 操作系统中安全地卸载 CUDA 9.0,同时避免影响 NVIDIA 图形驱动和其他相关组件。 ... [详细]
  • 如何在浩方平台畅玩CS1.6
    本文详细介绍了如何在浩方平台上安装、配置并顺利运行CS1.6,包括手动与自动搜索游戏启动器的方法,以及如何选择合适的服务器和房间以获得最佳游戏体验。 ... [详细]
  • 本项目基于网络上找到的一个启动动画包,针对Sony手机上的Miku启动动画进行了个性化调整,并重新打包以适应CM(CyanogenMod)系统。此版本旨在为CM用户提供更加个性化的启动体验。 ... [详细]
  • 使用Matlab创建动态GIF动画
    动态GIF图可以有效增强数据表达的直观性和吸引力。本文将详细介绍如何利用Matlab软件生成动态GIF图,涵盖基本代码实现与高级应用技巧。 ... [详细]
  • 尽管在WPF中工作了一段时间,但在菜单控件的样式设置上遇到了一些基础问题,特别是关于如何正确配置前景色和背景色。 ... [详细]
  • 本文深入探讨了Linux内核中进程地址空间的设计与实现,包括虚拟地址空间的概念、内存描述符`mm_struct`的作用、内核线程与用户进程的区别、进程地址空间的分配方法、虚拟内存区域(VMA)的结构以及地址空间与页表之间的映射机制。 ... [详细]
  • 漫画平台发布弹幕指南
    许多用户询问如何在漫画平台上发表弹幕。本文将详细介绍如何在漫画台发布弹幕,帮助用户更好地参与互动,提升阅读体验。 ... [详细]
  • 利用Node.js实现PSD文件的高效切图
    本文介绍了如何通过Node.js及其psd2json模块,快速实现PSD文件的自动化切图过程,以适应项目中频繁的界面更新需求。此方法不仅提高了工作效率,还简化了从设计稿到实际应用的转换流程。 ... [详细]
  • 本文详细介绍了如何在最新版本的Xcode中重命名iOS项目,包括项目名称、应用名称及相关的文件夹和配置文件。通过本文,开发者可以轻松完成项目的重命名工作。 ... [详细]
  • 本文介绍了记事本的基本保存方法以及通过辅助软件实现自动保存的技术,帮助用户更好地管理和保护重要数据。 ... [详细]
  • Fiddler 安装与配置指南
    本文详细介绍了Fiddler的安装步骤及配置方法,旨在帮助用户顺利抓取用户Token。文章还涵盖了一些常见问题的解决方案,以确保安装过程顺利。 ... [详细]
  • 在使用Flex 4.6部署ArcGIS Viewer for Flex 3.7时遇到的问题及解决方案,包括如何正确导入和配置必要的库文件。 ... [详细]
  • 本文探讨了如何在PHP与MySQL环境中实现高效的分页查询,包括基本的分页实现、性能优化技巧以及高级的分页策略。 ... [详细]
  • H5技术实现经典游戏《贪吃蛇》
    本文将分享一个使用HTML5技术实现的经典小游戏——《贪吃蛇》。通过H5技术,我们将探讨如何构建这款游戏的两种主要玩法:积分闯关和无尽模式。 ... [详细]
  • 在日常生活中,支付宝已成为不可或缺的支付工具之一。本文将详细介绍如何通过支付宝实现免费提现,帮助用户更好地管理个人财务,避免不必要的手续费支出。 ... [详细]
author-avatar
王一飞
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有